home *** CD-ROM | disk | FTP | other *** search
/ InfoMagic Internet Tools 1995 April / Internet Tools.iso / infoserv / www / cern / dev / www-talk.9301-9306.Z / www-talk.9301-9306 / text0494.txt < prev    next >
Encoding:
Text File  |  1995-04-24  |  1.7 KB  |  59 lines

  1.  
  2. I'm trying to write libHTML so that applications
  3. can just deal with C style character strings, and
  4. the library does all the SGML details.
  5.  
  6. The use of < and & to represent < and & never
  7. seemed to fit cleanly into the SGML view of things.
  8. So I posted to comp.text.sgml.
  9.  
  10. I think I'm a lot clearer on the matter now. The
  11. < and > entities are meant to be used in typesetting
  12. mathematics, where a less-than symbol is not necessarily
  13. the same thing as a '<' character.
  14.  
  15. There's a mechanism for referencing characters in the
  16. document character set in such a way that they will
  17. not be treated as markup: numeric character references.
  18.  
  19. I'd like to get rid of the <, >, and & entities
  20. from the HTML DTD. Granted, there will be a transition
  21. period while providers adjust, but I think it will make
  22. the spec cleaner.
  23.  
  24. Anyway, here's what the experts had to say...
  25.  
  26. [edited...]
  27.  
  28. Newsgroups: comp.text.sgml
  29. From: Erik Naggum <SGML@ifi.uio.no>
  30. Reply-To: Erik Naggum <enag@ifi.uio.no>
  31. Message-ID: <19921210.008@erik.naggum.no>
  32. Date: 10 Dec 1992 07:36:57 +0100
  33. References: <1992Dec10.020628.4884@news.eng.convex.com>
  34. Subject: Re: hiding <, >, and &
  35. Lines: 111
  36.  
  37. [Dan Connolly]
  38. :
  39. |   There is a lot of need for a routine represents an arbitrary string
  40. |   of characters as SGML data -- a routine that hides <tags> etc. from
  41. |   the parser.
  42.  
  43. The simplest would be to use character references for the characters
  44. that you need to quote.  See 9.5 Character Reference, [357:10-13].
  45.  
  46. ...
  47.  
  48. The way I see it, this is a completely failsafe technique.
  49.  
  50. |   [It does bring up the question of representing " and ' characters in
  51. |   attribute value literals. Hmm.. another situation I think I'll
  52. |   just avoid.]
  53.  
  54. What's wrong with "'", '"', """, and '''?
  55.  
  56. ...
  57.  
  58. </Erik>
  59.